1
Pemutaran Paralel: Memetakan Logika Berurutan ke Thread GPU
AI024Lesson 4
00:00

Pemutaran Paralel mewakili perubahan mendasar dalam filosofi komputasi dari urutan temporal (melakukan satu hal setelah yang lain) menjadi distribusi spasial (melakukan semua hal sekaligus di seluruh kisi).

1. Heuristik Independensi

Ini adalah aturan emas dalam komputasi GPU: “Kapan pun masalah Anda adalah ‘menerapkan sesuatu secara independen pada N elemen’, ini adalah pemetaan pertama yang harus dicoba.” Pendekatan paralel data ini adalah buah mudah yang bisa dipetik dari percepatan GPU, di mana beban manajemen thread terkalahkan oleh throughput simultan yang sangat besar.

2. Presisi dan Muatan

Kernel HIP biasanya menangani larik besar tipe dasar. Dalam grafis berkinerja tinggi dan pembelajaran mesin, kita sering menggunakan float (presisi tunggal), sementara simulasi ilmiah yang membutuhkan stabilitas numerik ekstrem menggunakan double (presisi ganda).

CPU: TemporalPENYATUANGPU: Spasial

3. Dari Iterasi ke Penghunian

Dalam kode CPU, prosesor "mengunjungi" data melalui loop. Dalam logika GPU, data "menghuni" sebuah thread. Anda berhenti menulis cara melakukan loop dan mulai menulis apa yang harus dilakukan oleh satu pekerja pada koordinat tertentu.

$$\text{Indeks } i = \text{blockIdx.x} \times \text{blockDim.x} + \text{threadIdx.x}$$

main.py
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>